语言基础的挑战是通过在现实世界中的引用中充分理解自然语言。尽管可以使用AI技术,但此类技术对人类机器人团队的广泛采用和有效性依赖于用户信任。这项调查提供了有关语言基础的新兴信任领域的三项贡献,包括a)根据AI技术,数据集和用户界面的语言基础研究概述;b)与语言基础有关的六个假设信任因素,这些因素在人机清洁团队经验中进行了经验测试;c)对语言基础的信任的未来研究指示。
translated by 谷歌翻译
Disagreements are frequently studied from the perspective of either detecting toxicity or analysing argument structure. We propose a framework of dispute tactics that unifies these two perspectives, as well as other dialogue acts which play a role in resolving disputes, such as asking questions and providing clarification. This framework includes a preferential ordering among rebuttal-type tactics, ranging from ad hominem attacks to refuting the central argument. Using this framework, we annotate 213 disagreements (3,865 utterances) from Wikipedia Talk pages. This allows us to investigate research questions around the tactics used in disagreements; for instance, we provide empirical validation of the approach to disagreement recommended by Wikipedia. We develop models for multilabel prediction of dispute tactics in an utterance, achieving the best performance with a transformer-based label powerset model. Adding an auxiliary task to incorporate the ordering of rebuttal tactics further yields a statistically significant increase. Finally, we show that these annotations can be used to provide useful additional signals to improve performance on the task of predicting escalation.
translated by 谷歌翻译
Restless multi-armed bandits are often used to model budget-constrained resource allocation tasks where receipt of the resource is associated with an increased probability of a favorable state transition. Prior work assumes that individual arms only benefit if they receive the resource directly. However, many allocation tasks occur within communities and can be characterized by positive externalities that allow arms to derive partial benefit when their neighbor(s) receive the resource. We thus introduce networked restless bandits, a novel multi-armed bandit setting in which arms are both restless and embedded within a directed graph. We then present Greta, a graph-aware, Whittle index-based heuristic algorithm that can be used to efficiently construct a constrained reward-maximizing action vector at each timestep. Our empirical results demonstrate that Greta outperforms comparison policies across a range of hyperparameter values and graph topologies.
translated by 谷歌翻译
We study the capabilities of speech processing systems trained simply to predict large amounts of transcripts of audio on the internet. When scaled to 680,000 hours of multilingual and multitask supervision, the resulting models generalize well to standard benchmarks and are often competitive with prior fully supervised results but in a zero-shot transfer setting without the need for any fine-tuning. When compared to humans, the models approach their accuracy and robustness. We are releasing models and inference code to serve as a foundation for further work on robust speech processing.
translated by 谷歌翻译
在许多现实世界中,当不二维测量值时,可能会提供自由旋转3D刚体(例如卫星)的图像观察。但是,图像数据的高维度排除了学习动力学和缺乏解释性的使用,从而降低了标准深度学习方法的有用性。在这项工作中,我们提出了一个物理知识的神经网络模型,以估计和预测图像序列中的3D旋转动力学。我们使用多阶段预测管道实现了这一目标,该管道将单个图像映射到潜在表示同构为$ \ Mathbf {so}(3)$,从潜在对计算角速度,并使用Hamiltonian Motion使用Hamiltonian运动方程来预测未来的潜在状态博学的哈密顿人的代表。我们证明了方法对新的旋转刚体数据集的功效,该数据集具有旋转立方体和矩形棱镜序列,并具有均匀且不均匀的密度。
translated by 谷歌翻译
我们介绍了IST和Unmabel对WMT 2022关于质量估计(QE)的共享任务的共同贡献。我们的团队参与了所有三个子任务:(i)句子和单词级质量预测;(ii)可解释的量化宽松;(iii)关键错误检测。对于所有任务,我们在彗星框架之上构建,将其与OpenKIWI的预测估计架构连接,并为其配备单词级序列标记器和解释提取器。我们的结果表明,在预处理过程中合并参考可以改善下游任务上多种语言对的性能,并且通过句子和单词级别的目标共同培训可以进一步提高。此外,将注意力和梯度信息结合在一起被证明是提取句子级量化量化宽松模型的良好解释的首要策略。总体而言,我们的意见书在几乎所有语言对的所有三个任务中都取得了最佳的结果。
translated by 谷歌翻译
我们引入了一个具有隐式规范正规化的概率模型,用于学习非负矩阵分解(NMF),该模型通常用于预测缺失值并在数据中找到隐藏模式,其中矩阵因子是与每个数据维度相关的潜在变量。潜在因素的非负限制是通过选择基于指数函数的指数密度或分布的支持的先验来处理的。采用基于Gibbs抽样的贝叶斯推理程序。我们在几个现实世界数据集上评估了该模型,包括癌症中药物敏感性的基因组学(GDSC $ ic_ {50} $)和具有不同尺寸和尺寸的基因体甲基化,并表明拟议的贝叶斯NMF GL $ _2^2^2 $ and and anGL $ _ \ infty $模型可以对不同的数据值进行强大的预测,并避免与竞争性贝叶斯NMF方法相比过度拟合。
translated by 谷歌翻译
晶体和分子感兴趣的特性,例如带隙,弹性和溶解度,通常相互关联:它们受相同的基础物理定律的控制。但是,当最新的图形神经网络尝试同时预测多个属性(多任务学习(MTL)设置)时,它们经常表现不佳。这表明图形网络可能无法完全利用这些潜在的相似性。在这里,我们研究了这种现象的潜在解释:每个物业损失表面的曲率都有很大变化,导致学习效率低下。曲率上的这种差异可以通过查看每个属性损耗函数的Hessians的光谱特性来评估,这是通过随机数值线性代数以无基质方式完成的。我们在两个基准数据集(材料项目(MP)和QM8)上评估我们的假设,并考虑这些发现如何为新颖的多任务学习模型的培训提供信息。
translated by 谷歌翻译
数十年来,源自人类活动的海洋碎片一直在海洋,湖泊和河流等水下环境中积累。由于无法理解散布的确切机制,因此难以评估废物的程度,类型和数量,从而对海洋环境和人类健康产生了未知的后果。因此,用于检测和映射海洋碎片的方法对于洞悉污染动力学至关重要,而污染动态又可以用来有效地计划和执行物理去除。使用配备了水下高光谱成像仪(UHI)和立体声相机的自动驾驶水下车辆(AUV),在挪威卑尔根贝尔根的庇护海湾商店Lungegaardsvann中自主检测,映射和量化了海洋碎片。
translated by 谷歌翻译
在本文中,我们提出了一种基于量化的蒸馏式低级神经辐射场(QDLR-NERF)表示的新型光场压缩方法。当现有的压缩方法编码光场子孔径图像集时,我们提出的方法以神经辐射场(NERF)的形式学习了隐式场景表示,这也可以使视图合成。为了降低其大小,该模型首先是在低级(LR)约束下使用张量列(TT)分解以交替的乘数(ADMM)优化框架进行的。为了进一步降低模型尺寸,需要量化张量列车分解的组件。但是,通过同时考虑低等级约束并考虑到速率受限的权重量化来实现NERF模型的优化是具有挑战性的。为了解决这个困难,我们引入了一个网络蒸馏操作,该操作将低级近似值和网络训练中的权重量化分开。根据LR-NERF的TT分解,将初始LR约束NERF(LR-NERF)的信息提炼为较小尺寸(DLR-NERF)的模型。然后,学会了优化的全局代码簿来量化所有TT组件,从而产生最终的QDLRNERF。实验结果表明,与最先进的方法相比,我们所提出的方法具有更好的压缩效率,并且还具有允许允许具有高质量的任何光场视图的合成。
translated by 谷歌翻译